کاوش الگوهای تکرار شونده در جریانهای داده

پایان نامه
چکیده

یافتن دسته داده های تکراری در جریان پیوسته تراکنشها یکی از مسائل حیاتی در کاربردهایی نظیر تحلیل سبد خرید، مانیتورینگ شبکه و پیش‎بینی فروش انبار می باشد. پنجره لغزان یکی از مدلهایی است که به دلیل مدیریت تغییر محتوا، مصرف حافظه محدود و سرعت پردازش کم به شکل گسترده در یافتن دسته داده های تکراری در جریانهای داده استفاده شده است. یک الگوریتم مبتنی بر مدل پنجره ای لغزان به یک ساختمان داده کارا احتیاج دارد که به سریعترین شکل ممکن با حذف و درج تراکنشها خود را به روز کند. به علاوه یک روش محاسباتی ابداعی نیز لازم است تا با تاخیر اندکی بعد از درخواست کاربر جهت مشاهده نتایج کاوش در یک پنجره، مجموعه دسته داده های تکراری را تولید کند. در این پایان نامه یک ساختمان داده کارا با نام دنباله بیتی بلوک بندی شده برای ذخیره و نگهداری محتویات پنجره معرفی شده است. به علاوه با یک تکنیک جدید این پنجره مورد پویش قرار گرفته تا مجموعه دسته داده های تکراری در پنجره جاری به شکلی کارا استخراج شوند. نتایج آزمایشات روی جریان داده های واقعی و مصنوعی نشان می دهد که این الگوریتم سریعتر از الگوریتمهایی است که اخیرا در زمینه کاوش جریانهای داده ارائه شده اند.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

کاوش الگوهای تکراری پرسود در پایگاه داده های بزرگ

داده­کاوی مجموعه اقلام پرسود در پایگاه داده تراکنشی، منجر به شناسایی مجموعه اقلام با بالاترین سودمندی می­شود. گرچه در سال های اخیر الگوریتم­های بسیاری برای این نمونه کار پیشنهاد شده است، اما این الگوریتم­ها، اکثراً، کارائی خود را صرف تولید مجموعه اقلام کاندید برای تولید مجموعه اقلام پرسود می­نمایند. چنانچه پایگاه داده دارای تعداد تراکنش­های بسیار زیاد و یا دارای مجموعه اقلام پرسود خیلی طولانی با...

کاوش برخط الگوهای پویای زمانی در داده های جریانی

کاوش در جریان داده فرایندی است که منجر به استخراج دانش از جریانی سریع از داده های پیوسته می شود. در سالهای اخیر، به دلیل اهمیت کاربردهای آن و پیشرفت در تکنولوژی سخت افزاری بسیار مورد توجه قرار گرفته شده است. در بسیاری از زمینه های کاربردی مانند شبکه های کامپیوتری، بازارهای مالی و مبادلات ارزی، مکالمات تلفنی، کارت های اعتباری، مراکز داده و سرورها، تصاویر ویدئویی، شبکه حسگرها، رادارها، ماهواره ها...

15 صفحه اول

کشف جوامع در شبکه های اجتماعی با استفاده از کاوش الگوی تکرار شونده

امروزه شبکه های اجتماعی اینترنتی به یک منبع غنی از داده های ناهمگون مبدل شده است. تجزیه و تحلیل این داده ها می تواند در تفسیر رفتار اجتماعی افراد درون شبکه و کشف اطلاعات ناشناخته بین کاربران مورد استفاده قرار گیرد. ”کشف جامعه“ به عنوان یکی از چالش های مهم در زمینه تجزیه و تحلیل شبکه های اجتماعی، به طور گسترده ای مورد مطالعه قرار گرفته است. بعضاً محققان، مشکل تشخیص جامعه را همان مشکل تشخیص خوشه ب...

کاوش الگوهای پویایی مشتریان در صنعت بانکداری

برای چندین دهه، سازمان‌ها بیش از مشتریان بر نشان تجاری و محصولاتشان تمرکز می‌کردند؛ اما اکنون بنگاه‌های اقتصادی بر ایجاد و حفظ ارتباط مؤثر با مشتریان متمرکز شده‌اند. در چنین شرایطی شناخت مشتریان و نیازهای آنان به امری حیاتی برای سازمان‌ها تبدیل شده است. یکی از پرکاربردترین روش‌های شناخت مشتریان، بخش‌بندی آنها به گروه‌های متجانس و شناخت ویژگی‌های هر بخش است؛ اما شیوه‌های سنتی و ایستای بخش‌بندی م...

متن کامل

همگرایی الگوهای تکرار شونده برای نگاشت های چند مقداری در فضاهای باناخ

در این رساله، در ابتدا، یک الگوی تکرار شونده را برای نگاشت های چند مقداری شبه انقباضی معرفی می کنیم و همگرایی این الگوی تکرار شونده را به یک نقطه ثابت نگاشت در فضاهای باناخ ثابت می کنیم. سپس، نگاشت چند مقداری غیر انبساطی نسبی را تعریف می کنیم. به علاوه، یک الگوی تکرار شونده را برای نگاشت های چند مقداری غیر انبساطی نسبی معرفی می کنیم و همگرایی این الگوی تکرار شونده را به یک نقطه ثابت نگاشت در ف...

15 صفحه اول

مقایسه عملکرد روش‌های مستقیم و تکرار شونده در پیش‌بینی زمان حقیقی نرخ تورم در ایران

نرخ تورم یکی از متغیرهای کلیدی اقتصاد کلان است که پیش‌بینی دقیق آن برای افق‌های بیش از یک دوره مورد نیاز نهادهای سیاستگذار و به ویژه بانک مرکزی است. روش‌های مستقیم و تکرار شونده دو تکنیک متداولی است که در ادبیات به­هنگام پیش‌بینی در افق‌های بیش از یک دوره پیشنهاد می‌شود. این مطالعه با بهره­گیری از طیف وسیعی از متغیرهای اقتصادی به بررسی این دو روش برای پیش‌بینی زمان حقیقی نرخ تورم در ایران می­پر...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شیراز - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023